Apprentissage par renforcement pour la conception de systèmes multi-agents réactifs
نویسندگان
چکیده
A new reinforcement learning (RL) methodology for the design of reactive multi-agent systems is presented. Although dealing with realistic situated agents with local perception does not belong to the framework where convergence of RL algorithm is guaranted, in our method each agent learns individually its local behavior. The progressive aspect of learning, which pits the agents against more and more complex sub-tasks, allows to go beyond the classical limitation of RL in this context. Our general framework is validated on a simulated environment where the agents have to coordinate themselves to reach a global goal. MOTS-CLÉS : processus décisionnels de Markov, agents réactifs, apprentissage par renforcement, apprentissage progressif, coordination, coopération
منابع مشابه
Une approche multi-agent adaptative pour la simulation de schémas tactiques
Résumé. Ce papier est consacré à la simulation ou à la réalisation automatique de schémas tactiques par un groupe d ́agents footballeurs autonomes. Son objectif est de montrer ce que peuvent apporter des techniques d'apprentissage par renforcement à des agents réactifs conçus pour cette tâche. Dans un premier temps, nous proposons une plateforme et une architecture d'agents capable d'effectuer d...
متن کاملApprentissage par Renforcement Inverse pour la Simulation d’Utilisateurs dans les Systèmes de Dialogue
Résumé : Les systèmes de dialogue sont des interfaces homme-machine qui utilisent le language naturel comme medium d’interaction. La simulation d’utilisateurs a pour objectif de simuler le comportement d’un utilisateur humain afin de générer artificiellement des dialogues. Cette étape est souvent essentielle dans la mesure où collecter et annoter des corpus de dialogues est un processus coûteux...
متن کاملClassification structurée pour l'apprentissage par renforcement inverse
Résumé : Cette contribution traite du problème de l’apprentissage par imitation par le biais de l’apprentissage par renforcement inverse (ARI). Dans ce contexte, un expert accomplit une tâche qu’un agent artificiel doit essayer de reproduire. L’ARI part du postulat que l’expert optimise avec succès une fonction de récompense ; le problème consiste à deviner cette fonction à partir de traces du ...
متن کاملApprentissage par démonstrations : vaut-il la peine d’estimer une fonction de récompense?
Résumé : Cet article propose une étude comparative entre l’Apprentissage par Renforcement Inverse (ARI) et l’Apprentissage par Imitation (AI). L’ARI et l’AI sont deux cadres de travail qui utilisent le concept de Processus Décisionnel de Markov (PDM) et dans lesquels nous cherchons à résoudre le problème d’Apprentissage par Démonstrations (AD). L’AD est un problème où un agent appelé apprenti c...
متن کاملFiltrage bayésien de la récompense
Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail géné...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Technique et Science Informatiques
دوره 22 شماره
صفحات -
تاریخ انتشار 2003